منو
  • Data WareHouse
  • بهینه سازی موتورهای جستجو محمد زند

Data WareHouse

Data WareHouse: Data WareHouse

Data WareHouse
تصویر محبوبه شهرياري خيرابادي
همه چیز در مورد Data Warehouse یا انبار داده ای
توسط محبوبه شهرياري خيرابادي - شنبه، 2 دي 1391، 08:19 ب.ظ
 

در این بحث می خواهیم به سوالات زیر پاسخ دهیم (فکر کنم یکی از مباحث درس پایگاه این ترم قرار است در این مورد باشد)

1- Data Warehouse (انبار داده ای ) چیست؟

2- چه خصوصیاتی دارد؟

3-چه تفاوتی با یک پایگاه داده دارد؟

4- چگونه طراحی و پیاده سازی می شود؟

در ادامه این پست به تک تک این موضوعات می پردازیم

تصویر مانيا شيراني
پاسخ: همه چیز در مورد Data Warehouse یا انبار داده ای
توسط مانيا شيراني - شنبه، 2 دي 1391، 10:13 ب.ظ
 

تكنولوژي انبار داده‌ها شامل مجموعه‌ای مفاهيم و ابزارهای جديدی است كه با فراهم آوردن اطلاعات از دانشگران (افراد اجرايي، مدير و تحليلگر) در تصميم گيری پشتيباني مي‌نمايد. دليل اصلي ساخت انبار داده ها، بهبود كيفيت اطلاعات در سازمان است، در واقع دسترسي به داده‌ها از هر جا درون سازمان داده‌ها از منابع داخلي و خارجي تهيه مي‌شوند و به اشكال گوناگون از داده‌های ساختاری گرفته تا داده‌های ساخت نيافته مانند فايل‌هاي متني يا چند رسانه‌ای، در مخزني مجتمع مي‌شوند. انبار داده‌ها يا DWH مخزني از اين داده‌هاست كه به صورتي قابل درك در دسترس كاربران نهايي كسب و كار قرار مي‌گيرد.

از اواسط سالهای 1980 نياز به انبار داده‌ها به وجود آمد و دريافتند كه سيستم های اطلاعاتي بايد به صورت سيستم‌های عملياتي و اطلاعاتي مشخص شوند. سيستم‌های عملياتي از فعاليت‌های روزانه كسب و كار پشتيباني مي‌نمايند و برای پاسخگويي سريع به ارتباطات از پيش تعريف شده مناسب هستند. داده‌های عملياتي ارائه بي‌درنگ و فعلي وضعيت كسب و كار مي‌باشند. اما سيستم‌های اطلاعاتي براي مديريت و كنترل كسب وكار به كار مي‌روند. اين سيستم‌ها از تجزيه و تحليل داده‌ها براي اتخاذ تصميم درباره عملكرد آني و آتي سازمان پشتيباني مي‌كنند و برای در خواست‌هاي موردی، پيچيده و به طور عمده فقط خواندني طراحي شده‌اند.داده‌هاي اطلاعاتي تاريخي هستند، به عبارتي بيانگر ديدگاه ثابتي از كسب وكار در يك دوره زماني مي‌باشند.

تصویر مانيا شيراني
پاسخ: همه چیز در مورد Data Warehouse یا انبار داده ای
توسط مانيا شيراني - شنبه، 2 دي 1391، 10:09 ب.ظ
 

ويژگيهاي اصلي داده‌های انبار داده‌ها

داده‌های موجود در انبار داده‌ها از سيستم‌های عملياتي متنوع (نظير سيستم‌هاي پايگاه داده‌ها) و منابع داده‌ای خارجي (نظير پايگاه داده‌های آماری و WWW )يكپارچه مي‌شوند. تفاوتهای ساختاری ومعنايي داده‌ها بايد پيش از يكپارچه سازی انسجام يابند. براي مثال داده‌ها بايد مطابق با مدل داده‌ای يكپارچه "همگن" شوند. بعلاوه، مقادير داده‌اي سيستم‌هاي عملياتي بايد پاك شوند تا داده‌های صحيحي در انبار داده‌ها وارد شوند. نياز به داده‌های تاريخي يكي از موارد مهم درشيوه انبار داده‌هاست. داده‌های تاريخي برای تحليل روند كسب وكارضروری هستند. البته هزينه نگهداری اين گونه داده‌ها نيز بايد مورد توجه قرار گيرد. بعلاوه، داده‌های انبار داده‌ها ثابت هستند، براي مثال دسترسي به DWH از نوع خواندني است. انجام اصلاحات در اين داده‌ها فقط هنگامي صورت مي‌گيرد كه اصلاحات داده‌های منبع در انبار انتشار يابند. DWH داده‌های ديگری به نام داده‌های اشتقاق يافته (derived data) دارد. اين داده‌ها به طور صريح در منابع عملياتي ذخيره نمي‌شوند، بلكه در حين بعضي از فرايندها از داده‌های عملياتي، اشتقاق مي‌يابند. برای مثال داده‌های فروش را مي‌توان در سطوح مختلف (هفتگي، ماهانه، فصلي) در انبار ذخيره نمود.

 

تصویر مانيا شيراني
پاسخ: همه چیز در مورد Data Warehouse یا انبار داده ای
توسط مانيا شيراني - شنبه، 2 دي 1391، 10:11 ب.ظ
 

سيستم‌هاي انبار داده‌ها

سيستم انبار داده‌ها (DWS) شامل انبار داده‌ها و همه مولفه‌هايي است كه براي ساخت، دستيابي و نگهداری DWH به كار مي‌روند. انبار داده‌ها بخش مركزی سيستم انبار داده‌ها را تشكيل مي‌دهد. گاهي اوقات انبار داده‌ها حجم عظيمي از اطلاعات را در واحدهای منطقي كوچكتر به نام Data Mart نگهداري مي‌كند. مولفه آماده سازی، مسووليت كسب يا دريافت داده‌ها را بر عهده دارد. اين مولفه شامل همه برنامه‌ها و‌برنامه‌های كاربردی‌ای است كه مسوول استخراج داده‌ها از منابع عملياتي هستند. مولفه دستيابي شامل برنامه‌های كاربردی مختلف (OLAP يا برنامه‌های كاربردی داده كاوی) است كه امكان استفاده از اطلاعات ذخيره شده در انبار داده‌ها را فراهم مي‌آورند.

مولفه مديريت Metadata، وظيفه مديريت، تعريف و دستيبابي به انواع مختلف Metadata را بر عهده دارد. در اصل ،‌Metadata "داده‌هايي درباره داده‌ها" يا "داده‌هايي است كه مفهوم داده‌ها را توصيف مي‌كنند". انواع مختلف Metadata در انبار داده‌ها وجود دارند. مثلا اطلاعاتي درباره منابع عملياتي، ساختار داده‌هاي DWH و كارهايي كه در حين ساخت، نگهداري و دستيبابي به DWH انجام مي‌شوند. نياز به Metadata شناخته شده است. پياده سازي يك DWS منسجم ،كار پيچيده و دشواري است و شامل دو فاز مي باشد. درفاز اول كه پيكربندي DWS نام دارد، ديدگاه مفهومي انبار داده‌ها مطابق با نيازمنديهای كاربر مشخص مي‌شود. سپس منابع داده‌ای دخيل و روش استخراج و بار گذاري در انبار داده‌ها تعيين مي‌گردد. سرانجام، درباره پايگاه داده‌های مورد نظر و روشهای دستيبابي داده‌ها تصميم گيری خواهد شد. پس از بار گذاري اوليه، در فاز عمليات DWS بايد داده‌های انبار داده‌ها به منظور منظم refresh شوند.

طراحي انبارداده‌ها

روشهای طراحي انبارداده‌ها امكان پردازش كارآمد query را برروي حجم عظيمي از داده‌ها فراهم مي‌آورند. نوع ويژه‌ای از الگوی پايگاه داده‌ها به نام star برای مدل سازی انبارداده‌های چند بعدی به كار مي‌رود. در اين حالت، پايگاه داده‌ها از يك جدول مركزی واقعيت يا fact و جداول چند بعدي تشكيل شده است. جدول واقعيت حاوی tuple هايي است كه بيانگر واقعيت‌هاي كسب و كار مانند فروش يا عرضه هستند. هر tuple جدول واقعيت به tupleهای جدول چند بعدي اشاره دارد. هرtuple جدول چند بعدي مواردي نظير محصولات، مشتريان، زمان و فروشنده را نشان مي‌دهد.

انبارداده‌های مجازی

هدف انبارداده‌های مجازی، پياده سازي سريع انبارداده‌ها بدون نياز به ذخيره سازي و نگهداری كپي‌هاي متعدد از داده‌های منبع است. اغلب، انبارداده‌هاي مجازی به سازمانها كمك مي‌كند تا به نياز واقعي كاربران نهايي پي ببرند. كاربران نهايي مي‌خواهند به طور مستقيم به داده‌هاي منبع بي درنگ با كمك ابزارهای توانمند شبكه‌ای دسترسي پيدا كنند. معايب اين روش عبارتند از:

- كيفيت و سازگاري داده‌ها تضمين نمي‌شود. زيرا فعاليت‌های آماده سازی داده‌ها صورت نمي‌گيرند.

- به طور معمول، داده‌های تاريخي وجود ندارند.

- زمان دسترسي كاربر نهايي بسته به وجود يا عدم وجود منابع عملياتي، ‌بار شبكه و پيچيدگي درخواست، غير قابل پيش بيني است.

 

 

تصویر سوگل ربيعي ساوجي
پاسخ: همه چیز در مورد Data Warehouse یا انبار داده ای
توسط سوگل ربيعي ساوجي - شنبه، 2 دي 1391، 10:26 ب.ظ
 

سلام به شما دوست عزیز

انباره داده (DatawareHouse)

انـبـار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد. انبارهای داده حاوی داده هایی هستند که به مرور زمان از سیستم های عملیاتی آنلاین سازمان (OLTP) استخراج می شوند، بنابراین سوابق کلیه اطلاعات و یا بخش عظیمی از آنها را می توان در انبار داده ها مشاهده نمود.

از آنجائیکه انجام عملیات آماری و گزارشات پیچیده دارای بارکاری بسیار سنگینی برای سرورهای پایگاه داده می باشند، وجود انبار داده سبب می گردد که اینگونه عملیات تاثیری بر فعالیت برنامه های کاربردی سازمان (OLTP) نداشته باشد.
همانگونه که پایگاه داده سیستم های عملیاتی سازمان ( برنامه های کاربردی ) به گونه ای طراحی می شوند که انجام تغییر و حذف و اضافه داده به سرعت صورت پذیرد، در مقابل انبار داده ها دارای معماری ویژه ای می باشند که موجب تسریع انجام عملیات آماری و گزارش گیری می شود

در محيط خادم/مخدوم انباره داده يعني انباره (Repository) اطلاعات براي مصرف سيستم هاي پشتيباني تصميم گيري.انباره داده یک مخزن فعال و هوشمند از اطلاعات است كه قادر است اطلاعات را از محيط هاي گوناگون جمع آوري و مديريت كرده و نهايتا پخش نمايد و در صورت لزوم نيز سياست هاي تجاري را روي آنها اجرا نمايد.

بعضي از خصوصيات Data warehouse ها از اين قرارند:
•يکپارچه بودن
•متغير با زمان
•غير فرار
•موضوع گرا (Subject-oriented)

مزاياي كاربرد DW در سازمان

- DW در واقع حافظه يكپارچه سازمان است.
- DW، اطلاعات دقيقي از وضعيت قبل و كنوني Business سازمان در اختيار مي گذارد.
- DW باعث كاهش هزينه هاي گسترش نرم افزاري مي شود.
- DW باعث فراهم آوري كارايي بهبود يافته براي پرس و جو تحليلي مي شود
- DW باعث كاهش هزينه تبادلات داده اي در محيط هاي عملياتي (Operational Environment) مي شود
- در DW قابليت گزارش گيري و پرسش از بانك اطلاعاتي و امكان پاسخ سريع به سوالات تجاري سازمان وجود دارد
- در DW امكان تبديل داده هاي خام به اطلاعات استراتژيكي وجود دارد

تصویر بشير بهزادي
پاسخ: همه چیز در مورد Data Warehouse یا انبار داده ای
توسط بشير بهزادي - يکشنبه، 3 دي 1391، 12:09 ق.ظ
  مراحل و نحوه ایجاد انبار داده در سازمان:


پس از شناخت و تحلیل سازمان، اولین قدم برای ساخت یک پروژه‌ی هوش تجاری ایجاد انبار داده است. بر اساس نیاز باید اطلاعات را از منابع مختلف استخراج و جمع آوری(Extract)، پالایش (Transform) و در یک پایگاه داده ذخیره (Load) کنیم. به عملیات استخراج، پالایش و بارگذاری، ETL گفته می‌شود. امروزه ابزارهای زیادی برای انجام فرآیند ETL وجود دارد که تا حدود زیادی دقت و سرعت انجام این عملیات را بالا برده است. هر یک از این مراحل جزئیاتی دارند که:



۱- استخراج داده‌ها از پایگاه‌های داده به یک مخزن واحد

شناخت منابع داده‌های سازمان و استخراج داده‌های ارزشمند از آن‌ها یکی از اصلی ترین مراحل ایجاد انبار داده است. داده‌هایی که بایست در قالب انبار گرد هم آیند غالباً به صورت پراکنده‌ تولید شده‌اند. برای مثال در یک فروشگاه زنجیره‌ای داده‌ها از طریق کامپیوترهای مراکز خرید مختلف، دستگاه‌های خرید اتوماتیک (مثل دستگاه‌های خرید نوشابه یا روزنامه) و نرم افزارهای انبارداری و حسابداری، به دست می‌آیند. انبار داده برای انجام وظیفه خود که همان تحلیل داده‌ها است باید همه این داده‌ها را با هر قالبی که تولید می‌شوند به طور مرتب و دقیق دریافت نماید. استخراج داده‌ها در یک محیط واسط که کم و بیش شبیه انبار داده‌ها است صورت می‌گیرد.



۲- پالایش داده‌ها

داده‌های استخراج شده را باید بررسی نماییم و در صورت نیاز تغییراتی در آن‌ها ایجاد کنیم. دلیل این کار، استخراج اطلاعات از پایگاه‌ داده‌های مختلف و برطرف نمودن نیازهای سازمان است. معمولا تمامی مراحل پالایش داده‌ها در محیط واسط انجام می‌گیرد اما گاهی برخی از مراحل پالایش در هنگام بارگذاری در انبار داده انجام می‌شود.

٣- بارگذاری داده های پالایش شده

پس از انجام مراحل استخراج و پالایش نوبت به بارگذاری داده‌ها در انبار داده‌ها است. معمولا در این مرحله فقط عمل بارگذاری انجام می‌گیرد اما گاهی ممکن است انجام یکی از مراحل پالایش در هنگام بارگذاری صورت گیرد. درانبار داده فیلدها در جاهای مختلفی تکرار می شوند و روابط بین جداول کمتر به چشم می خورند. علت آن هم افزایش سرعت پردازش اطلاعات هنگام گزارشات و عملیات آماری می‌باشد.

تصویر بشير بهزادي
پاسخ: همه چیز در مورد Data Warehouse یا انبار داده ای
توسط بشير بهزادي - يکشنبه، 3 دي 1391، 12:10 ق.ظ
  حال انبار داده‌ها با مقادیر اولیه ساخته شده است، اما این پایان کار نیست! هر روزه داده‌های بیشتر و جدیدی به پایگاه‌ داده‌ها اضافه می‌شود و باید شرایطی را فراهم کنیم تا این داده‌ها به صورت خودکار و بدون دخالت کاربر، پس از استخراج و پالایش در انبار داده بارگذاری شود.

پس از بارگذاری داده‌ها نوبت به استفاده از اطلاعات ذخیره شده در انبار داده‌ها است. این کار توسط ابزارهای گزارش گیری (Reporting Services)، داده‌کاوی و OLAP انجام می‌شود.
مرکز داده‌ها یا Data Mart: انبار داده ها حجم عظیمی از اطلاعات را در واحد های منطقی کوچکتری به نام مرکز داده نگهداری می کند مرکز داده ها نمونه های کوچکی از انبارداده ها بوده و همانند آنها حاوی کپی هایی ثابت از داده هایی هستند که در موارد خاص استفاده می شوند.
تصویر الهام عطاري
پاسخ: همه چیز در مورد Data Warehouse یا انبار داده ای
توسط الهام عطاري - يکشنبه، 3 دي 1391، 01:10 ب.ظ
 

انبار داده ( Data Warehouse ) چیست؟

انـبـار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری ، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد.

تكنولوژي انبار داده‌ها شامل مجموعه‌ای مفاهيم و ابزارهای جديدی است كه با فراهم آوردن اطلاعات از دانشگران (افراد اجرايي، مدير و تحليلگر) در تصميم گيری پشتيباني مي‌نمايد. دليل اصلي ساخت انبار داده ها، بهبود كيفيت اطلاعات در سازمان است، در واقع دسترسي به داده‌ها از هر جا درون سازمان داده‌ها از منابع داخلي و خارجي تهيه مي‌شوند و به اشكال گوناگون از داده‌های ساختاری گرفته تا داده‌های ساخت نيافته مانند فايل‌هاي متني يا چند رسانه‌ای، در مخزني مجتمع مي‌شوند. انبار داده‌ها يا DWH مخزني از اين داده‌هاست كه به صورتي قابل درك در دسترس كاربران نهايي كسب و كار قرار مي‌گيرد.

انـبـار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری ، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد. انبارهای داده حاوی داده هایی هستند که به مرور زمان از سیستم های عملیاتی آنلاین سازمان ( OLTP ) استخراج می شوند، بنابراین سوابق کلیه اطلاعات و یا بخش عظیمی از آنها را می توان در انبار داده ها مشاهده نمود.

از آنجائیکه انجام عملیات آماری و گزارشات پیچیده دارای بارکاری بسیار سنگینی برای سرورهای پایگاه داده می باشند، وجود انبار داده سبب می گردد که اینگونه عملیات تاثیری بر فعالیت برنامه های کاربردی سازمان ( OLTP ) نداشته باشد.

همانگونه که پایگاه داده سیستمهای عملیاتی سازمان ( برنامه های کاربردی ) به گونه ای طراحی می شوند که انجام تغییر و حذف و اضافه داده به سرعت صورت پذیرد، در مقابل انبار داده ها دارای معماری ویژه ای می باشند که موجب تسریع انجام عملیات آماری و گزارش گیری می شود ( OLAP ) .

مراحل و نحوه ایجاد انبار داده در سازمان

1- استخراج داده های تراکنشی از پایگاه های داده به یک مخزن واحد
شناخت منابع داده های سازمان و استخراج داده های ارزشمند از آنها یکی از اصلی ترین مراحل ایجاد انبار داده می باشد.
2- تبدیل داده ها
از آنجائیکه سیستمهای اطلاعاتی و برنامه های کاربردی یک سازمان غالبا توسط افراد و پروژه های مختلف به مـرور زمان در مواجهـه با نیـازهای جدید سـاخته یا تغییر شـکل داده می شـوند، یکسـان سـازی آنها امری ضروری می باشد.در بسیاری از موارد نیز سیستمهای اطلاعاتی در بستر های مختلف پایگاه داده مانند Microsoft SQL Server ، Oracle ، Sybase ، Microsoft Access و غیره طراحی گردیده اند. بررسی جداول، برقراری ارتباط بین فیلدها و یک شکل سازی داده ها در این مرحله صورت می پذیرد.

 3- بارگذاری داده های تبدیل شده به یک پایگاه داده چند بعدی
بر خلاف پایگاه داده سیستمهای عملیاتی ( OLTP ) که دارای معماری رابطه ای می باشند و از اصول نرمالیزه استفاده می کنند، طراحی انبار داده به شکلی ویژه بدون بهره گیری از اصول نرمالیزاسیون می باشد. درانبار داده فیلدها در جاهای مختلفی تکرار می شوند و روابط بین جداول کمتر به چشم می خورند. علت آن هم افزایش سرعت پردازش اطلاعات هنگام گزارشات و عملیات آماری می باشد.

 4- تولید مقادیر از پیش محاسبه شده جهت افزایش سرعت گزارش گیری
مـقادیر از پیـش محاسـبه شده را تراکـم نیـز مـی نامـند. ایـن مرحلــه توســط سیستـمهایی نظــیر Microsoft SQL Server Analysis Services بسیار ساده تر شده است. ایـن تراکم ها کـه در ابـعاد مختلـف انبار داده سـاخته
می شوند، موجب می شوند که سرعت انجام عملیات گزارش گیری به شکل محسوسی افزایش یابد. بایدتوجه داشت که عملیات ساخت این مقادیر بسیار زمان گیر بوده و نیازمند حافظه زیادی بر روی سروراست.
5- ساخت ( یا خرید ) یک ابزار گزارش گیری
پس از انجام مراحل فوق، شـما می توانـید نسبـت به ساخت یا خـرید یـک نرم افزار گزارش گیـری تصمیم گیری نمایید. به طور معمـول هزینه سـاخت یک نرم افزار گزارش گـیری، بالاتـر از هزینـه خریـد آن از یک شرکت خارجـیمی شود.

ويژگيهاي اصلي داده‌های انبار داده‌ها

داده‌های موجود در انبار داده‌ها از سيستم‌های عملياتي متنوع (نظير سيستم‌هاي پايگاه داده‌ها) و منابع داده‌ای خارجي (نظير پايگاه داده‌های آماری و WWW )يكپارچه مي‌شوند. تفاوتهای ساختاری ومعنايي داده‌ها بايد پيش از يكپارچه سازی انسجام يابند. براي مثال داده‌ها بايد مطابق با مدل داده‌ای يكپارچه "همگن" شوند. بعلاوه، مقادير داده‌اي سيستم‌هاي عملياتي بايد پاك شوند تا داده‌های صحيحي در انبار داده‌ها وارد شوند.

 نياز به داده‌های تاريخي يكي از موارد مهم درشيوه انبار داده‌هاست. داده‌های تاريخي برای تحليل روند كسب وكارضروری هستند. البته هزينه نگهداری اين گونه داده‌ها نيز بايد مورد توجه قرار گيرد. بعلاوه، داده‌های انبار داده‌ها ثابت هستند، براي مثال دسترسي به DWH از نوع خواندني است. انجام اصلاحات در اين داده‌ها فقط هنگامي صورت مي‌گيرد كه اصلاحات داده‌های منبع در انبار انتشار يابند. DWH داده‌های ديگری به نام داده‌های اشتقاق يافته ( derived data ) دارد. اين داده‌ها به طور صريح در منابع عملياتي ذخيره نمي‌شوند، بلكه در حين بعضي از فرايندها از داده‌های عملياتي، اشتقاق مي‌يابند. برای مثال داده‌های فروش را مي‌توان در سطوح مختلف (هفتگي، ماهانه، فصلي) در انبار ذخيره نمود.

25 نظر

  • محمد زند / 10 شب / 5 دی 1395, / جواب

    ارسال آرشیو محتوا

    • محمد زند / 10 شب / 5 دی 1395, / جواب

      محتوای ارسالی از آرشیو 1393

به صفحه اول خوش آمدید